圖/本報AI製圖(示意圖)
人工智慧
6 hours ago

#人工智慧
#大型語言模型
#AI安全
#數據版權
#網路內容
圖/本報AI製圖(示意圖)
圖/本報AI製圖(示意圖)
商傳媒|責任編輯/綜合外電報導
摘要

隨著人工智慧公司未經同意爬梳大量網路資料訓練大型語言模型,部分內容創作者開始利用名為「AI陷阱池」的工具,故意投餵無用資料以「毒害」模型,可能導致其輸出品質大幅下降,進而影響使用者體驗。

為提升大型語言模型(LLM)的智慧化程度與使用者體驗,人工智慧(AI)聊天機器人需持續消化數據進行訓練。然而,許多AI公司在未經資料擁有者同意的情況下,便逕行爬梳網頁內容,將其納入大型語言模型的資料庫中。此舉引發部分內容創作者,亦即智慧財產權持有者的反彈,他們正運用一種稱為「AI陷阱池」(tarpits)的工具進行反制。

「AI毒害」(AI poisoning)的目標是破壞AI聊天機器人背後的大型語言模型,使其產生錯誤、誤導性或荒謬的輸出。這種破壞是透過在模型訓練過程中,誘騙其吸收不正確的資料來達成,訓練過程通常涉及爬梳網際網路上的所有可能網站和影像。

根據《Fast Company》報導,有別於 Nightshade 這類針對影像生成式AI模型的「毒害」工具,Nightshade 會在影像中加入肉眼不可見、但對LLM爬蟲可見的像素層,使AI將藝術作品誤判為另一種風格,進而阻止其模仿藝術家實際風格。AI陷阱池則是一種專為文本型大型語言模型設計的AI毒害工具,其運作方式是欺騙網路爬蟲,使其吸取無用的垃圾數據。

當大型語言模型利用這些垃圾數據生成文字內容時,其輸出的結果將會不正確,大幅降低AI回應的品質。最終,這可能導致使用者對AI聊天機器人失去信任,進而減少使用。